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(57) Abstract: The invention relates to a 
method for coding a structured document, 
wherein a plurality of codes is generated 
by means of one or more schemata and/or 
name spaces. For a schema and/or a name 
space and/or for a group of schemata 
and/or name spaces independent codes 
for the elements defined or declared in the 
schemata and/or in the groups of schemata 
and/or name spaces are allocated. For 
every schema and/or name space an 
allocation to additional schemata and/or 
name spaces is carried out. The invention 
also relates to a corresponding coding 
method, a coding device, a decoding 
device and coding/decoding device. 
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(57) Zusammenfassung: Die Erfindung 
betrifft ein Verfahren zur Codierung 
eines strukturierten Dokuments, bei 
dem werden eine Vielzahl von Codes 
mittels eines oder mehrerer Schemas 
und/oder Namensraume erzeugt. Dabei 
werden fur ein Schema und/oder einen 
Namensraum und/oder fur eine Gruppe 
von Schemas und/oder Namensraumen 
jeweils separate, von anderen Schemas 
und/oder Namensraumen unabhangige 
Codes fur die mittels in den Schemas 
und/oder Namensraumen und/oder in 
den Gruppen von Schemas und/oder 
Namensraumen definierten und/oder 
deklarierten Elemente vergeben. 
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Zu jedem Schema und/oder Namensraum wird eine Zuordnung zu weiteren Schemas und/oder Namensraumen gebildet. Des Weit- 
eren betrifft die Erfindung ein hierzu entsprechendes Decodierverfahren, eine Codiereinrichtung, eine Decodiereinrichtung sowie 
Codier-/Decodiereinrichtung. 
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Verfahren und Vorrichtung zur Codierung und Decodierung von 
strukturierten Dokumenten 



Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur 
Codierung und Decodierung von strukturierten Dokumenten gemafl 
dem Oberbegriff des Anspruchs 1. 

XML (= extensible markup language) ist eine Sprache, mit der 
eine strukturierte Beschreibung der Inhalte eines Dokuments 
mittels XML-Schema-Sprachdef initionen ermoglicht wird. Eine 
genauere Beschreibung des XML-Schemas sowie der darin verwen- 
deten Strukturen, Datentypen und Inhaltsmodelle findet sich 
in den Referenzen 

" http : / /www . w3 . o rg/TR/ 2001 /REC-xml s chema- Q-2Q01Q502/, 

- http: //www. w3.org/TR/2001/REC-xmlschema-l-2 0010502/ , 

- http: //www. w3 .org/TR/2001/REC-xmlschema-2-2Q010502/. 

Aus Schriften zum MPEG-7-Standard, insbesondere ISO/IEC 
15938-1 "Multimedia Content Description Interface —Part 1: 
Systems" , Geneva 2 002, sind Verfahren, Vorrichtungen oder 
Systeme zur Codierung bzw. Decodierung von XML-basierten Do- 
kument bekannt. 

Erweiterungen zu dem Verfahren, Vorrichtungen oder Systeme 
zur Codierung bzw. Decodierung von XML-basierten Dokument 
sind aus Schriften zum MPEG-7-Standard, sind aus der deut- 
schen Anmeldung mit dem amtlichen Aktenzeichen 10351897.5 
bekannt. Darin ist ein Verfahren zur Codierung eines struktu- 
rierten Dokuments, insbesondere eines XML-basierten Dokuments 
offenbart, bei dem eine Vielzahl von Codes mittels eines oder 
mehrerer Schemas und/oder Namensraume erzeugt werden, wobei 
fur ein Schema und/oder einen Namensraum und/oder fur eine 
Gruppe von Schemas und/oder Namensraumen jeweils separate, 
von anderen Schemas und/oder Namensraumen unabhangige Codes 
fur die mittels in den Schemas und/oder Namensraumen und/oder 
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in den Gruppen von Schemas und/oder Namensraumen definierten 
und/oder deklarierten Elemente vergeben werden . 

Diese ermoglichen eine effiziente Codierung auch dann, wenn 
5 Schemas dem Encoder und/oder Decoder nicht vollstandig be- 
kannt sind. Dies wird erreicht, indem Codetabellen fur die 
Datentypen, die globalen Elemente und die Ersetzungsgruppen 
nach Namensraumen getrennt werden, wobei unter einem Namens- 
raum dabei ein Raum zu verstehen ist, in dem darin verwende- 
10 ten Namen von Datentypen (Typnamen) mit eindeutigen Bedeutun- 
gen belegt und definiert sind. 

Bekannte Verfahren zur binaren Representation von MPEG- 7 und 
anderen XML-basierten Beschreibungen oder Dokumenten weisen 

15 Defizite hinsichtlich En- und Decodierungskomplexitat auf f 

sofern die zu codierende XML Beschreibung oder das XML Doku- 
ment auf mehreren Namensraumen beruht. Beispielsweise wird in 
den oben genannten Schriften ein Verfahren zur binaren Repra- 
sentation von XML-Beschreibungen und XML— Dokumenten beschrie- 

20 ben f das Codetabellen fur XML-Beschreibungen und XML- 
Do kumente basierend auf Schemas und Namensraumen bestimmt (Ira 
Folgenden wird der Ausdruck "Namensraum" synonym ftir den Aus- 
druck "Schema" verwendet) . 

25 GemaB der bekannten Verf ahrensweise konnen dabei Datentypen 
von anderen Datentypen vererbt sein. Diese Vererbungsbezie- 
hung erlaubt, in einem XML Dokument anstatt einer Instanz des 
Basistyps eine Instanz eines vererbten* Typs zu verwenden. 

30 Der Typecode signalisiert ausgehend vom Basistyp welchen Typs 
eine Instanz ist. Ausgehend von einem Basistypen in einem 
ersten Namensraum muss zur Bestimmung der adressierbaren Typ- 
namen in einem zweiten Namensraum bei En- und/oder Decodie- 
rung die Vererbungsstruktur uber mehrer Namensraume analy- 

35 siert werden. Hierzu wird ein Vererbungsbaum aufgebaut, wie 

er in der ISO/IEC 15938-1 "Multimedia Content Description In- 
terface -Part 1: Systems", Geneva 2002 , beschrieben ist. 
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Dies setzt voraus, dass alle Namensraume bekannt sind und der 
gesamte Vererbungsbaum ±m Speicher aufgebaut werden kann. Der 
gesamte Vererbungsbaum besteht aus den Kennzeichnern der be- 
5 nannten Typen aller fur die Instanziierung einer XML Be- 

schreibung und/oder XML Dokuments referenzierten Namensraume 
und deren Vererbungsbeziehung. Das beschriebene Verfahren ist 
daher sehr aufwendig. 

10 Die der Erfindung ^ugrundeliegende Aufgabe besteht nun darin, 
ein gegenuber dem aus dem Stand der Technik vereinf achtes 
Verfahren und eine Vorrichtung zur Codierung und Decodierung 
von strukturierten Dokumenten anzugeben. 

15 Diese Aufgabe wird ausgehend von dem Verfahren zur Codierung 
gemalb den Merkmalen des Oberbegriffs des Anspruchs 1, ausge- 
hend von dem Verfahren zur Codierung gemaJB den Merkmalen des 
Oberbegriffs des Anspruchs 2, ausgehend von dem Verfahren zum 
Decodieren gemaii den Merkmalen des Oberbegriffs des Anspruchs 

20 17 , sowie ausgehend von der Codiervorrichtung gema.15 Anspruch 
22 , der Decodiervorrichtung gemaii Anspruch 23 und der Codier- 
/Decodiervorrichtung gemaft dem Anspruch 24 , jeweils durch de- 
ren kennzeichnenden Merkmale gelost. 

25 

Bei dem erf indungsgemaften Verfahren zur Codierung eines 
strukturierten, insbesondere XML-basierten Dokuments, bei dem 
eine Vielzahl von Codes mittels eines oder mehrerer Namens- 

■ 

raume erzeugt und fur mittels Namensraumen definierten Typen 
30 vergeben werden, wird eine Teilmenge adressierbarer Typen ei- 
nes der Namensraume auf Grundlage von Vererbungsbeziehungen 
zwischen den Namensraumen sowie der Namensraume der Basisty- 
pen der Teilmenge ermittelt. 

35 Das Verfahren zeichnet sich dadurch vorteilhaft aus, dass le- 
diglich ein geringer Teil der insgesamt vorhanden Namensraume 
zur Identif izierung der adressierbaren Teilmenge gespeichert 
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bzw. geladen werden muss. Daher 1st eine enorme Entlastung 
von Ressourcen die Folge und zudem wird das Codieren be- 
schleunigt. 

5 Alternativ oder erganzend wird bei dem Verfahren zur Codie- 
rung eines strukturierten, insbesondere XML-basierten, Doku- 
ments zu jedem Namensraum eine Zuordnung zu weiteren Namens- 
raumen derart gebildet wird, dass zumindest eine Zuordnungs- 
information dergestalt erzeugt, dass zumindest eine Verer- 

10 bungsbeziehung zwischen einem erbenden Namensraum und verer- 
benden Namen s raumen beschrieben ist. Hierbei wird ein Namens- 
raum, der Typen enthalt, die direkt von einem Basistypen aus 
einem anderen Namensraum vererbt sind, erbender Namensraum 
genannt und ein Namensraum, der Basistypen enthalt, die in 

15 einen anderen Namensraum vererbt worden sind, vererbender Na- 
mensraum. 

Die durch diese Weiterbildung bereitgestellten Zuordnungsin- 
formationen ermoglichen eine strukturierte Organisation von 
20 Vererbungsinf ormationen, so dass lediglich ein Teil des ge- 

samten Vererbungsbaums fur die Identif izierung der Teilmenge .« 
von Noten ist. Diese Weiterbildung fuhrt somit zu einer wei- 
teren Ressourceneinsparung/-entlastung und Beschleunigung. 

25 Vorzugsweise wird die Zuordnungs information des erbenden Na- 
mensraums aus einer Liste von Codes der Basistypen von Kopf- 
typen des erbenden Namensraums, gebildet, wobei Kopftypen Ty- 
pen sind, die direkt von einem Basis typ des vererbenden Na- 
mensraums abstammen und wobei die Basistypen auch durch Kopf- 

30 typen gebildet werden, denen weitere Kopftypen entstammen. 

Bevorzugt wird die adressierbare Teilmenge ausgehend von ei- 
nem Startbasistyp der Basistypen des vererbenden Namensraums 
ermittelt, wobei zur Identif izierung der Teilmenge in der Re- 
35 gel ausgehend von dem Startbasistyp zur Ermittlung der Teil- 
menge Kopftypen im erbenden Namensraum durch die Zuordnungs- 
information identif iziert werden, die von einem Basistypen 
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aus dem vererbenden Naraensraum abstammen, bei denen der 
Startbasistyp ein Basistyp in dem vererbenden Namensraum 1st. 

Alternativ oder erganzend wird bei dem Verfahren zur Codie- 
5 rung eines strukturierten, insbesondere XML-basierten, Doku- 
ments zu mindestens einem Namensraum die den erbenden Namens- 
raumen zugeordnete Zuordnungsinf ormation gemeinsam mit dem 
jeweiligen Namensraum in einem die Codierung und/oder Deco- 
dierung vornehmenden ersten Gerat gespeichert wird. 

10 

Bei einer Weiterbildung wird die den erbenden Namensraumen 
zugeordnete Zuordnungsinf ormation in einem zweiten Gerat er- 
zeugt und gemeinsam dem jeweiligen Namensraum in einem die 
Codierung und/oder Decodierung vornehmenden ersten Gerat ii- 

15 bermittelt. 

Das hier beschriebene Verfahren ist vorteilhaft, da nun zur 
Bestimmung der adressierbaren Datentypen nur der Namensraum 
des Basis typen, der Namensraum des zu adressierenden Daten- 
typs und die Vererbungsbeziehung BT bekannt sein und/oder ge- 

20 laden werden muss. 

Ein wesentlicher Vorteil des erf indungsgemafien Verfahrens ist 
eine effiziente Bestimmung der adressierbaren Typnamen zu er- 
moglichen, ohne den gesamten Vererbungsbaum aufbauen zu miis- 
25 sen. Zudem kann dies auch ohne Kenntnis aller Schemas oder 
Namensraume erf olgen . 

Ein weiterer Vorteil besteht darin, dass die Suche nach dem 
adressierten Datentyp mit weniger Vergleichoperationen reali- 
30 siert werden kann verglichen mit der Suche im gesamten Verer- 
bungsbaum . 

In einer Ausf uhrungsf orm besteht die Vererbungsinf ormation BT 
eines Namensraums NS aus einer Liste an Typcodes TC LBT der Ba- 
35 sistypen LBT je Kopftypen HT des Namensraums NS . 
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In einer weiteren Ausfuhrungsf orm hierzu werden die Typecodes 
nach folgendem Verfahren vergeben: 

Zur Codierung eines strukturierten Dokuments werden eine 
5 Vielzahl von Codes mittels eines oder mehrerer Schemas 

und/oder Namensraume erzeugt. Dabei werden fur ein Schema 
und/oder einen Namensraura und/oder fur eine Gruppe von Sche- 
mas und/ oder Namensraumen jeweils separate, von anderen Sche- 
mas und/oder Namensraumen unabhangige Codes fur die mittels 
10 in den Schemas und/oder Namensraumen und/oder in den Gruppen 
von Schemas und/oder Namensraumen definierten und/oder dekla- 
rierten Elemente vergeben . 

Bei Weiterbildung hiervon werden Codes in Schemas und/oder 
15 Namensraumen separiert vergeben. Das hier beschriebene Ver- 
fahren ist vorteilhaft, da nun Schemas und/oder Namensraume 
nach Bedarf auch wahrend der Ubertragung von Dokumenten gela- 
den werden kdnnen und existierende Codetabellen fur andere 
Namensraume sich hierdurch nicht andern und somit nicht neu 
20 erstellt werden mussen. Ein weiterer Vorteil besteht darin, 
dass die separaten Codes fur Falle, in denen sehr viele Na- 
mensraume importiert werden, weniger Bits zur Adressierung 
benotigen, als wenn wie in ISO/IEC 15938-1 "Multimedia Con- 
tent Description Interface —Part 1: Systems", Geneva 2002, 
25 alle Namensraume zusammengef asst werden. Auch in Fallen, in 
denen ein sehr grofter Namensraura importiert wird, konnen die 
separaten Codes fur die anderen Namensraume mit weniger Bits 
codiert werden. 

30 In einer bevorzugten Variante der Erfindung sind die separa- 
ten Codes in Adressbereiche eingeteilt, wobei uber die Ad- 
res sbereiche das Schema und/oder der Namensraum bzw. die 
Gruppe von Schemas und/oder Namensraumen identif izierbar 
wird. 

35 

In einer bevorzugten Ausfuhrungsf orm des erf indungsgema&en 
Codierverf ahrens umfassen die separaten Codes jeweils einen 
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lokalen Code bezuglich des Schemas und/oder des Namensraums 
und/oder bezuglich der Gruppe von Schemas und/oder Namensrau- 
men und einen Identif ikationscode, der das Schema und/oder 
den Namensraum und/oder die Gruppe von Schemas und/oder Na- 
5 mensraumen identif iziert . Ein lokaler Code ist hierbei ein 
Code, der eindeutig innerhalb des durch den Identif ikations- 
code identif izierten Schemas bzw. Namensraums ist. 

Vorzugsweise werden separate Codes fur globale Elemente 
10 und/oder SubstitutionGroups und/oder Datentypen vergeben . Ei- 
ne genaue Definition fur globale Elemente, SubstitutionGroups 
und Datentypen findet sich in den XML-Schema-Def initionen, 
die in den Dokumenten - http://www.w3.org/TR/2 001/REC- 
xrnlschema-0-2 0010502/ , http: //www.w3 . org/TR/2 001/REC- 
15 xmlschema-1-2 0010502/ und http://www.w3.org/TR/2001/REC- 
xmlschema-2-20010502/, genau erlautert sind. 

Fur Datentypen TypeCodes, die in dem Dokument ISO/IEC 15938-1 
"Multimedia Content Description Interface —Part 1: Systems", 

20 Geneva 2002, erlautert sind, werden separate Codes in einer 
bevorzugten Ausf uhrungsf orm derart erzeugt, dass innerhalb 
des Vererbungsbaums eines Namensraums der zu einem ersten Da- 
tentyp in demselben Namensraum benachbarten Datentyp einen 
Codeabstand zu dem ersten Datentyp hat, welcher der Anzahl 

25 der in diesem Namensraum von dem ersten Datentyp abgeleiteten 
Datentypen entspricht. Ein Datentyp ist zu einem ersten Da- 
tentyp benachbart, wenn der Datentyp vom gleichen Basisdaten- 
typ wie der erste Datentyp abgeleitet worden ist und dem Da- 
tentyp unter alien Datentypen, die von diesem Basisdatentypen 

30 abgeleitet worden sind, der kleinste TypeCode zugewiesen wur- 
de, der groiier als der TypeCode des ersten Datentyps ist. Bei 
dieser Ausfuhrungsf orm werden die Codes fur die Datentypen 
TypeCodes innerhalb des - moglicherweise disjunkten - Verer- 
bungsbaums so vergeben, dass eine vorteilhafte Nachbar- 

35 schaf tsbeziehung in einem gegebenen Namensraum entsteht und 
erhalten bleibt, auch wenn in diesem Namensraum Unterbaume 
mit aus anderen Namensraumen abgeleiteten Typen vorkommen. 
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In einer besonders bevorzugten Ausfuhrungsf orm des erfin- 
dungsgemaiien Verfahrens werden die separaten Codes innerhalb 
eines gegebenen Namensraums gemaft einem Verfahren vergeben, 
5 das folgende Schritte umfasst: 

- in einem ersten Schritt werden alle Datentypen eines Na- 
mensraums, die von Datentypen anderer Namensraume vererbt 
worden sind, in der im MPEG-7 Standard definierten Reihenfol- 

10 ge der globalen TypeCodes der jeweiligen Basis datentypen in 
einer Liste sortiert, wobei die Basisdatentypen die Datenty- 
pen in anderen Namensraumen sind, von denen die sortierten 
Datentypen vererbt worden sind; 

- in einem zweiten Schritt werden jeweils diejenigen Datenty- 
15 pen eines Namensraums, die von einem bestimmten Basisdatenty- 
pen eines bestimmten anderen Namensraums vererbt worden sind, 
lexikographis ch s ortiert ; 

- in einem dritten Schritt werden alle Datentypen eines Na- 
mensraums, die nicht von einem Datentypen eines anderen Na- 

20 mens ramus vererbt worden sind, entsprechend der im MPEG-7 

Standard definierten Reihenfolge in die bestehende Liste von 
Datentypen eins ortiert; 

- in einem vierten Schritt werden die separaten Codes in der 
Reihenfolge der Liste an die Datentypen des Namensraums ver- 

2 5 geben • 

Der Vorteil dieser Ausfuhrungsf orm ist, dass der adressierte 
Datentyp, insbesondere ein TypeCode, schnell gefunden und so- 
mit decodiert werden kann. Nach den Regeln in ISO/IEC 15938-1 

30 "Multimedia Content Description Interface -Part 1: Systems", 
Geneva 2002, adressiert ein TypeCode einen abgeleiteten Typ 
relativ zu einem Basistypen. Also definiert der Basistyp ei- 
nen Unterbaum, in dem alle adressierbaren Datentypen vorhan- 
den sind. Sind in dem Unterbaum nun mehrere Namensraume ent- 

35 halten, so kann durch die vorteilhafte Nachbarschaf tsbezie- 
hung, die durch die obige Ausfuhrungsf orm der Erfindung er- 
reicht wird, in dem Namensraum ein adressierter Datentyp 
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sclinell gefunden werden, da durch einen Vergleich eines ge- 
suchten Datentyps mit zwei benachbarten Datentypen im sor- 
tierten Vererbungsbaum festgestellt werden kann, ob sich der 
gesuchte Datentyp im Unterbaum des Datentypen der zwei be- 
5 nachbarten Datentypen rait dem kleineren binaren Code befin- 
det. Auf diese Weise kann der Suchaufwand erheblich verrin- 
gert werden, Ein weiterer Vorteil dieser Nachbarschaf tsbezie- 
liung besteht darin, dass ein Decoder bei einer Codierung der 
TypeCodes gemafl ISO/IEC 15938-1 ''Multimedia Content Descrip- 
10 tion Interface -Part 1: Systems", Geneva 2002, die Codewort- 
lange, die sich aus der Anzahl der abgeleiteten Datentypen 
bestimmt, direkt aus dem Codeabstand der benachbarten Daten- 
typen berechnen kann. 

15 In einer weiteren Ausfuhrungsform werden die lokalen Typcodes 
nach dem oben beschriebenen Verfahren vergeben, wobei in ei- 
ner Weiterbildung hiervon, der Typecode TC 181 aus NamensraumID 
und lokalem Typcode nach dem in oben beschriebenen Verfahren 
gebildet wird. 

20 

In einer waiter en Ausfuhrungsform werden die lokalen Typcodes 
nach dem oben beschriebenen Verfahren vergeben und nur Basis- 
typen des ersten Namensraums betrachtet, deren lokaler Typco- 
de 

25 a) grofier als der lokale Typcode des Startbasistyps OBT 

ist und 

b) kleiner als der kleinste, nachstgroJiere lokale Typcode 
eines zum Starbasistypen OBT benachbarten Typen ist. 

30 In einer bevorzugten Ausfuhrungsform des erf indungsgema&en 
Verfahrens werden die Vererbungsbeziehungen BT zwischen Na- 
mensraumen mit einem Schema und/oder Namensraum gespeichert 
und/oder ubertragen. 

35 Neben dem oben beschriebenen erf indungsgemaflen Codierverf ah- 
ren betrifft die Erfindung ferner ein Decodierverf ahren, mit 
dem ein strukturiertes Dokument, insbesondere ein XML- 
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basiertes Dokument decodiert wird, wobei das Verfahren derart 
ausgestaltet ist, dass ein mit dem erfindungsgemafien Codier- 
verfahren codiertes Dokument decodiert wird. 

5 In einer bevorzugten Ausgestaltung des erfindungsgemafien De- 
codierverf ahrens wird hierbei zur Decodierung eines binaren 
TypeCodes - dessen Erzeugung oben beschrieben ist - die Code- 
lange des separaten Codes fur den binaren TypeCode aus der 
Anzahl der abgeleiteten Daten bestimmt. Vorzugsweise wird 
10 ferner in einer bevorzugten Ausf uhrungsf orm zur Decodierung 
eines bestimmten TypeCodes des Subbaums des Vererbungsbaums 
des Namensraums, in dem sich der bestimmte TypeCode befindet, 
anhand der Codeabstande zwischen benachbarten Datentypen er- 
mittelt . 

15 

Bei einer Weiterbildung wird zur Bestiramung der Basistypen 
die von einem Startbasistypen entstaramen, anhand der Codeab- 
stande zwischen benachbarten Datentypen ermittelt. 

20 Eine weitere Alternative oder Erganzung ist gegeben, wenn bei 
dem zur Bestimmung der Anzahl an Typen in der ^eilmenge aus- 
gehend von den Kopf typen anhand der Codeabstande zwischen be- 
nachbarten Kopf typen ermittelt wird. 

25 Neben den oben beschriebenen Verfahren betrifft die Erfindung 
ferner eine Codiervorrichtung sowie eine Decodiervorrichtung 
zur Durchfuhrung der erfindungsgemafien Codier- bzw. Decodier- 
v^rf ahrens- Ferner umfasst die Erfindung eine Codier- und ei- 
ne Decodiervorrichtung, mit der das erf indungsgemafie Codier- 

30 verfahren und das erf indungsgemafie Decodierverf ahren durch- 
fuhrbar ist- 

Ausfuhrungsbeispiele der Erfindung werden nachfolgend anhand 
der beigefiigten Zeichnungen naher erlautert. 

35 

Es zeigen: 
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Figur 1 eine Prinzipdarstellung eines Codier- und Decodier- 

systems in welchem das erf indungsgemaiie Verfahren 
zura Tragen kommt. 

5 Figur 2 eine Darstellung einer beispielhaf ten XML-Schema- 
Definition, in der auch Datentypen aus anderen Na- 
mensraumen importiert sowie abgeleitet werden. 

Figur 3 eine Darstellung eines Vererbungsbaums von Datenty- 
10 pen, einschlieftlich der Zuordnung der lokalen Codes 

zu in den Namensraumen auftretenden Typen. 

Figur 4 eine Darstellung eines Vererbungsbaums von Datenty- 
pen, der sich liber mehrer Namensraume erstreckt. 

15 

Figur 5 eine Darstellung eines Vererbungsbaums inklusive 

Vererbungsinf ormationen zwischen Namensraumen. 



20 In Figur 1 ist beispielhaf t ein Codier- und Decodiersystem, 
in dem das erf indungsgemafie Verfahren zum Einsatz kommt, mit 
einem Encoder ENC und einem Decoder DEC dargestellt, mit de- 
nen XML-Dokumente DOC codiert bzw. decodiert werden. Sowohl 
der Encoder als auch der Decoder verfiigen beide liber ein so— 

25 genanntes XML-Schema S, in dem die zur Kommunikation genutz- 
ten Elemente und Typen des XML-Dokuments deklariert und defi- 
niert sind. Aus dem Schema S werden uber entsprechende Sche- 
ma-Compilationen SC im Encoder und Decoder Code-Tabellen CT 
erzeugt. Wenn das XML-Dokument DOC codiert wird, werden den 

30 Inhalten des XML-Dokuments uber die Code-Tabellen binare Co- 
des zugeordnet. Hierdurch wird eine Binardarstellung BDOC des 
Dokuments DOC erzeugt, die mithilfe der Code-Tabelle CT im 
Decoder wieder decodiert werden kann. Es konnen hierbei meh- 
rere Schemas verwendet werden, insbesondere konnen auch Sche- 

35 mas eingesetzt werden, welche auf einem Basisschema beruhen 
und aus einem weiteren Schema abgeleitet werden. 
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In Figur 2 1st beispielhaf t ein Auszug aus einer XML-Schema- 
Definition gezeigt. Dem Fachmann sinci solche XML-Schema- 
Definitionen bekannt, so dass auf den genauen Inhalt des Aus- 
zugs der Figur 2 nicht eingegangen wird. Der Auszug enthalt 
5 zwei Schemadef initionen, zum einen wird im oberen Teil ein 
Schema A definiert, wie durch eine geschweifte Klammer ange- 
deutet ist, zum anderen wird im unteren Teil ein Schema X de- 
finiert, wie ebenfalls durch eine geschweifte Klammer ange- 
deutet wird. Das Schema X verwendet wiederum Datentypen, die 
10 aus dem Schema A importiert worden sind. 

In Figur 3 sind die Vererbungsbeziehungen zwischen einem ers- 
ten Namensraum NS1 und einem zweiten Namensraura NS2 und deren 
Datentypen in der Form eines Ausschnitts einer Baumstruktur 

15 grafisch dargestellt. Wie der Figur anhand des rtickwarts ge- 
richteten nichtgestrichelten Pfeils entnommen werden kann, 
besteht eine Vererbungsbeziehung zwischen dem zweiten Namens- 
raum NS2 und dem ersten Namensraum NS1 . Jeder Knoten in dem 
Vererbungsbaum reprasentiert einen definierten, benannten Da- 

20 tentyp in der Schemadef inition . Mit dem in der deutschen An- 
meldung mit dem amtlichen Aktenzeichen 10351897.5 beschriebe- 
nen Verfahren werden fur die Namensraume NS1..NS2 jeweils lo- 
kale Codes vergeben, die in Figur 3 durch die Zahlen links 
neben den Knoten spezifiziert sind, Diese sogenannten lokalen 

25 Typecodes adressieren alle Typen in einem Namensraum eindeu- 
tig. Bei der erf indungsgemaiien Signalisierung eines Datentyps 
ausgehend von einem Startbasistyp OBT im ersten Namensraum 
NS1 ist die Menge der adressierbaren Typen im zweiten Namens- 
raum NS2 eine - durch die gestrichelte Umrandung angedeutete 

30 - Teilmenge TM aller Typen in dem Namensraum NS2 . Dementspre- 
chend werden nur wenige Typcodes verwendet , die in Figur 3 
durch die Zahlen rechts neben den Knoten spezifiziert sind 
und die gegebenenf alls nur eine kurzere binarer Representati- 
on erfordern. 

35 

In Figur 4 sind vier Namensraume NS1..NS4 dargestellt, zwi- 
schen denen auch indirekte Vererbungsbeziehungen existieren; 
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d.h. Vererbungsbeziehungen, bei denen zwischen einem abgelei- 
teten Typ und einem Basistyp raindestens ein weiterer Namens- 
raum der Namensraume NS1..NS4 liegt. 

5 Erf indungsgemaB lasst sich nun ausgehend von dem hervorgeho- 
ben dargestellten Startbasistyp OBT im ersten Namensraum NS1 
eine - in der Darstellung durch die gestrichelte Umrandung 
hervorgehobene- Menge TM von adressierbaren Typen durch Be- 
trachtung von Vererbungsbeziehungen aller Namensraume 
10 NS1..NS4 bestiramen. 

In Figur 5 sind fur den vierten Namensraum NS4 die gemaJ5 ei— 
ner Variante des erf indungsgema.fr en Verfahrens strukturierten 
Vererbungsinf ormationen BT1..BT3 dargestellt. 

15 

Zu erkennen 1st dabei, dass die Strukturierung derart herbei- 
gefuhrt wird, dass fur jeden Datentyp, der direkt von einem 
Datentyp aus einem anderen Namensraum vererbt ist {die jewei- 
lige direkte Vererbung ist durcli jeweils einen nichtgestri- 

20 chelten riickwarts gerichteten Pfeil dargestellt) , die Verer- 
bungsinf ormationen BTl. . BT3 gespeichert und/oder von einem 
ersten zu einem zweiten Gerat ubertragen werden, wobei die 
Vererbungsinf ormationen BT1..BT3 eines Datentypen gema£ der 
gezeigten Ausf iihrungsvariante aus einer Kennzeichnung des je- 

25 weiligen Namensraums NAMENSRAUM_JED und dem lokalen Typcode 
der Basis typen LBT, LBT' in den jeweiligen vererbenden Na- 
mensraum NS1, NS3 sowie NS4 bestehen. 

i r 

Ausgehend von diesen strukturierten Vererbungsinf ormationen 
30 BT1-.BT3 wird der Kern des erf indungsgemaften Verfahrens deut- 
lich, der darin liegt, dass statt des gesamten Vererbungs- 
baums, der sich aus der Vereinigungsmenge der Vererbungsver- 
haltnisse aller Namensraume ergibt, lediglich die Namensraume 
von Startbasis typen OBT, der zu adressierenden Typen und die 
35 Vererbungsbeziehung BT1..BT3 zwischen demjenigen Namensraum 
(erbender Namensraum) , der die adressierbaren Typen enthalt, 
und demjenigen Namensraum (vererbender Namensraum) , der den 
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jeweiligen Startbasistypen OBT enthalt, gespeichert und fur 
die Bestimmung der adressierbaren Datentypen TM verwendet 
werden . 

5 Die Vererbungs information (-beziehung) BT1..BT3 identif iziert 
somit ini Grunde Basistypen von Kopftypen eines Namensraums, 
wobei man unter Kopftypen diejenigen Datentypen versteht, die 
direkt auf einem Basis typ aus einem vererbenden Namensraum 
basieren und wobei als Basistypen hierbei diejenigen Datenty- 
10 pen IiBT eines vererbenden Namensraums NSl, NS3 sowie NS4 ver- 
standen werden, die 

a) direkter Basistyp {LBT) eines Kopftypen (HT) , oder 

b) direkter Basistyp (LBT'') eines Kopftypen (HT' ) eines 
15 etwaigen weiteren sich in der Vererbungshierarchie be- 

findenden - gemafl dem Aus fuhrungsbei spiel dritten- Na- 
mensraums NS3 sind, wobei der Kopftyp HT' direkter oder 
indirekter Basistyp des Kopftypen HT im Namensraum des 
abgeleiteten Typen ist. 

20 

Ausgehend von dieser erfindungsgema^en Strukturierung werden 
nun bei dem erf indungsgemafien Verfahren ausgehend von einem 
Startbasistyp OBT in einem ersten Namensraum NSl die adres- 
sierbaren Datentypen TM in einem zweiten Namensraum NS2 iden- 
25 tif iziert , indem 

a) Kopftypen HT in dem zweiten Namensraum identif iziert 
werden, zu denen Typen LBT und LBT f aus dem ersten Na- 
mensraum als Vererbungsinformation BT1..BT3 abgelegt 
sind, und 

30 b) der Typ OBT ein Basistyp der Typen LBT bzw. LBT' ist. 

Somit lasst sich lediglich zusammen mit dem Vererbungsbaum 
des erbenden Namensraums ausgehend von einem als Basistyp 
f estzulegenden Datentyps des vererbenden Namensraums NSl eine 
35 Menge der adressierbare Typen bestimmen, ohne Kenntnis aller 
im erbenden Namensraum importierter Namensraume haben zu miis- 
sen. Hieraus ergibt sich eine enorme Aufwandsminimierung, die 
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sich in einer Einsparung von Rechenleistung und Speicher- 
platzbedarf sowie einer beschleunigten Codierung bzw. Deco- 
dierung niederschlagt . 
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Pat ent an spr la che 

1. Verfahren zur Codierung eines strukturierten, insbesondere 
XML-basierten Dokuments, bei dem eine Vielzahl von Codes mit- 

5 tels eines Oder mehrerer Namensraume (NS1..NS4) erzeugt und 
fur mittels Namensraumen (NS1..NS4) definierten Typen verge- 
ben werden 

dadurch gekennzeichnet, 

dass eine Teilmenge (TM) bestehend aus adressierbaren Typen 
10 eines Namensraums (NS2) ausgehend von einem Startbasistypen 

(OBT) auf Grundlage einer Vererbungsbeziehung (BT1..BT3) zwi- 
schen den Namensraumen (NS1-.NS4) sowie der Vererbungsbezie- 
hungen in einem Namensraum des Basistypen (OBT) und der Ver- 
erbungsbeziehungen in dem Namensraum der Teilmenge (TM) er- 
15 mitt el t wird. 

2. Verfahren zur Codierung eines strukturierten, insbesondere 
XML-basierten, Dokuments nach dem Oberbegriff des Anspruchs 1 
oder nach dem Anspruch 1, 

20 dadurch gekennzeichnet, 

u. dass zu jedem Namensraum eine Zuordnung *zu weiteren Namens- 
raumen derart gebildet wird, dass zumindest eine Zuordnungs- 
information (NAMENSRAUM_ID , TYPECODE) dergestalt erzeugt 
wird, dass zumindest eine Vererbungsbeziehung (BT1..BT3) zwi- 

25 schen einem erbenden Namensraum (NS2) und vererbenden Namens- 
raumen (NS1, NS3, NS4) beschrieben ist. 

3. Verfahren nach Anspruch 2, 
dadurch gekennzeichnet , 

30 dass die Zuordnungsinf ormation des erbenden Namensraums (NS2) 
aus einer Liste von Codes (TYPECODES) der Basistypen (LBT, 
LBT' ) von Kopftypen (HT) des erbenden Namensraums gebildet 
wird, wobei Basistypen (LBT, LBT' ) Typen sind, von denen di- 
rekt der Kopftyp (HT) entstammt (LBT) oder von denen ein 

35 Kopftyp (HT' ) entstammt, der wiederum Basistyp eines Kopftyps 
(HT) des erbenden Raums (NS2) ist (LBT' ) . 
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4. Verfahren nach Anspruch 3, 
dadurch gekennzeichnet, 

dass die adressierbare Teilmenge (TM) ausgehend von einem 
Startbasistyp (OBT) durch Bestinimung der Basistypen (LBT, 
5 LBT" ) des vererbenden Namensraums (NS1) ermittelt wird. 

5. Verfahren nach Anspruch 4, 
dadurch gekennzeich.net, 

dass 

10 a) ausgehend von dem Startbasistyp (OBT) zur Ermittlung der 

Teilmenge (TM) Kopftypen (HT) im erbenden Namensraum (NS2) 
ermittelt werden, zu denen Basistypen (LBT, LBT' ) aus dem 
vererbenden Namensraum (NS1) durch die Zuordnungsinf orma- 
tion ( NAMENSRAUM_I D , TYPECODE) identif iziert sind, 

15 b) der Startbasistyp (OBT) ein Basistyp der Basistypen (LBT, 
LBT') des vererbenden Namensraums (NS1) 1st . 

6. Verfahren nach einem der vorhergehenden Ansprtiche, 
dadurch gekennzeichnet, 

20 dass die den erbenden Namen s raumen (NS2) zugeordnete Zuord- 
nungsinf ormation 4NAMENSRAUM_ID, TYPECODE) gemeinsam mit dem ^ 
jeweiligen Namensraum (NS2) in einem die Codierung und/oder 
Decodierung vornehmenden ersten Gerat gespeichert wird. 

25 7. Verfahren nach Anspruch 6, 
dadurch gekennzeichnet, 

dass die den erbenden Namensraumen (NS2) zugeordnete Zuord- 
nungsinf ormation (NAMENSRAUM__I D , TYPECODE) in einem zweiten 
Gerat erzeugt und gemeinsam dem jeweiligen Namensraum (NS1 
30 NS2) in einem die Codierung und/oder Decodierung vornehmenden 
ersten Gerat ubermittelt wird. 

8, Verfahren nach einem der vorhergehenden Ansprtiche, 
dadurch gekennzeichnet, 
35 dass fur ein Schema und/oder einen Namensraum und/oder fur 

eine Gruppe von Schemas und/oder Namensraumen jeweils separa- 
te, von anderen Schemas und/oder Namensraumen unabhangige Co- 
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des fur die mittels in den Schexnas und/oder Namensraumen 
und/oder in den Gruppen von Schemas und/oder Namensraumen de- 
finierten und/oder deklarierten Elemente vergeben werden . 

5 9. Verfahren nach Anspruch 8, bei dem zur Identif ikation des 
Schemas und/oder des Namensraums und/oder der Gruppe von 
Schemas und/oder Namensraumen die separaten Codes in entspre- 
chende Adressbereiche unterteilt sind. 

10 10. Verfahren nach einem der Anspruche 8 bis 9, bei dem die 
separaten Codes jeweils einen lokalen Code beziiglich des 
Schemas und/oder des Namensraums und/oder bezuglich der Grup- 
pe von Schemas und/oder Namensraumen und einen Identif ikati— 
onscode zur Identif ikation des Schemas und/oder des Namens- 

15 raums und/oder der Gruppe von Schemas und/oder Namensraumen 
umf as sen. 

11. Verfahren nach einem der Anspruche 8 bis 10, 

bei dem separate Codes fur globale Elemente und/oder Substi- 
20 tutionGroups und/oder Datentypen erzeugt werden. 

12. Verfahren nach Anspruch 11, bei dem separate Codes fur Da- 
tentypen TypeCodes derart erzeugt werden, dass innerhalb des 
Vererbungsbaums eines Namensraums, der zu einem ersten Daten- 

25 typ in demselben Namensraum benachbarten Datentyp einen Code- 
abstand .zu dem ersten Datentyp hat, welcher der Anzahl der in 
diesem Namensraum von dem ersten Datentyp abgeleiteten Daten- 
typen entspricht. ' 

30 13. Verfahren nach einem der Anspruche 8 bis 12, bei dem die 
separaten Codes innerhalb eines gegebenen Namensraums gemafi 
einem Verfahren vergeben werden, das folgende Schritte um- 
fasst : 

- in einem ersten Schritt werden alle Datentypen eines Na- 
35 mensraums, die von Datentypen anderer Namensraume vererbt 

worden sind, in der im MPEG- 7 Standard definierten Reihenfol- 
ge der globalen TypeCodes der jeweiligen Basis datentypen in 

18 



WO 2005/084029 



PCT/EP2005/050264 



einer Liste sortiert, wobei die Basisdatentypen die Datenty- 
pen in anderen Namensraumen sind, von denen die sortierten 
Datentypen vererbt worden sind; 

- in einem zweiten Schritt werden jeweils diejenigen Datenty- 
5 pen eines Namensraums, die von einem bestimmten Basisdatenty- 
pen eines bestimmten anderen Namensraums vererbt worden sind, 
lexikogr aphis ch sortiert ; 

- in einem dritten Schritt werden alle Datentypen eines Na- 
mensraums, die nicht von einem Datentypen eines anderen Na- 

10 mensraums vererbt worden sind, entsprechend der im MPEG-7 

Standard definierten Reihenfolge in die bestehende Liste von 
Datentypen einsortiert; 

- in einem vierten Schritt werden die separaten Codes in der 
Reihenfolge der Liste an die Datentypen des Namensraums ver- 

15 geben. 

14. Verfahren zur Decodierung eines strukturierten Dokuments, 
insbesondere eines XML-basierten Dokuments, wobei das Verfah- 
ren derart ausgestaltet ist, dass ein mit einem Verfahren ge- 
20 maft einem der vorhergehenden Anspruche codiertes Dokument de- 
v,i codiert wird. 

15- Verfahren nach Anspruch 14 zur Decodierung eines gemaii 
dem Verfahren des Anspruchs 12 codierten Dokuments, bei dem 
25 zur Decodierung eines binaren TypeCodes aus der Anzahl der 

abgeleiteten Datentypen die Codelange der separaten Codes der 
binaren Typecodes bestimmt wird. 

16. Verfahren nach Anspruch 14 oder 15 zur Decodierung eines 
30 gemaiJ dem Verfahren des Anspruchs 5 codierten Dokuments, bei 

dem zur Decodierung eines bestimmten Typecodes der Subbaum 
des Vererbungsbaums des Namensraums, in dem sich der bestimm- 
te Typecode befindet, anhand der Codeabstande zwischen be- 
nachbarten Datentypen ermittelt wird. 

35 

17. Verfahren zur Decodierung eines strukturierten Dokuments, 
insbesondere eines XML-basierten Dokuments, wobei das Verfah- 
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ren derart ausgestaltet 1st, dass ein init einem Verfahren ge- 
mafi einem der vorhergehenden Anspruche codiertes Dokument de- 
codiert wird. 

* 

5 18. Verfahren nach Anspruch 17 zur Decodierung eines gemafi 
deni Verfahren des Anspruchs 12 codierten Dokuments, bei dem 
zur Decodierung eines binaren TypeCodes aus der Anzahl der 
abgeleiteten Datentypen die Codelange der separaten Codes der 
binaren Typecodes bestimmt wird. 

10 

19. Verfahren nach Anspruch 17 oder 18 zur Decodierung eines 
gemaB dem Verfahren des Anspruchs 12 codierten Dokuments, bei 
dem zur Decodierung eines bestimmten Typecodes der Subbaum 
des Vererbungsbaums des Namensraums, in dem sich der bestiram- 

15 te Typecode befindet, anhand der Codeabstande zwischen be- 
nachbarten Datentypen ermittelt wird. 

20. Verfahren nach Anspruch 17 bis 19 zur Decodierung eines 
gemaJ& dem Verfahren des Anspruchs 12 codierten Dokuments , bei 

20 dem zur Bestimmung der Basistypen (LBT, LBT' ) , die von einem 
Startbasistypen (OBT) entstamrnen, anhand der Codeabstande 
zwischen benachbarten Datentypen ermittelt wird. 

21. Verfahren nach Anspruch 17 bis 20 zur Decodierung eines 
25 gemafi dem Verfahren des Anspruchs 12 codierten Dokuments , bei 

dem zur Bestimmung der Anzahl an Typen in der Teilmenge TM 
ausgehend von den Kopftypen (HT) anhand der Codeabstande zwi- 
schen benachbarten Kopftypen (HT) ermittelt wird. 

30 22. Codiervorrichtung, welche derart ausgestaltet ist, dass 
ein Codierverf ahren nach einem der Anspruche 1 bis 13 durch- 
fuhrbar ist. 

23. Decodiervorrichtung, welche derart ausgestaltet ist, dass 
35 ein Decodierverf ahren nach einem der Anspruche 14 bis 21 
durchf uhrbar ist . 



20 



WO 2005/084029 



PCT/EP2005/050264 



24. Codier- und Decodiervorrichtung umfassend eine Codiervor- 
richtung nach Anspruch 22 und eine Decodiervorrichtung nach 
Anspruch 23. 
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FIG 2 

FIG 2A 

?xml version ="1.0" encoding="IS0-8859-1"?> 

< schema targetNamespace="urn:siemens:SchemaA" 
xml ns:a= "urn:mySchema:SchemaA" 
xmlns:xs="http://www.w3.org/2001/XMLSchema" 

<complexType name="Node1"> 
<sequence> 

< element name="name" type="xs:string"/> 
<element name= "value" type="xs:integer"/> 

</sequence> 
</complexType> 

</comp I exTy pe name = "my Fi rsffy pe" > 
<complexContent> 

< extension base="a:Node1"> 

<sequence> 

<element name="state" type="xs:string"/> 
</sequence> 
</extension> 
</complexContent> 
</complexType> 

<complexType name="mySecondType"> 
<complexContent> 

< extension base= "a:myFirstType"> 

<sequence> 

<element name— id" type="xs:ID"/> 
</sequence> 
</extension> 
</complexContent> 
</complexType> 
</schema> 

<?xml version="1.0" encoding = "ISO-8859-1 "? > 

< schema targetNamespace— 'urn: mySch etna: Sen emaX" 
xmlns:x="urn:mySchema:SchemaX" 
xmlns:a="urn:mySchema:SchemaA" 

xm I ns:xs = "http ://www.w3. org/2001 /XM LSchema" 
<import namespace ="urn: mySchema:SchemaA" 
SchemaLocation="./TreeExample:nsA.xsd"/> 



FIG 2A 



FIG 2B 



WO 2005/084029 



3/6 



PCT/EP2005/050264 



FIG 2B 

<complexType name="tType"> 
<sequence> 

< element name="name" type="xs:string"/> 
<element name="value" type="xs:integer"/> 

</sequence> 
</complexType> 
<complexType name="iType"> 

<complexContent> 

< extension base="a:Node1"> 

<sequence> 

<element name="state" type— 'xs:string"/> 
</sequence> 
</extension> 
</complexContent> 
</complexType> 
<complexType name="sType"> 
<complexContent> 

< extension base="a:Node1"> 

<sequence> 

<element name="id" type="xs:ID"/> 
</sequence> 
</extension> 
</complexContent> 
</complexType> 
</complexType name="nType"> 

<complexContent> 

< extension base="x:sType"> 

<sequence> 

<element name = "price" type="xs:float"/> 
</sequence> 
</extension> 
</complexContent> 
</complexType> 
</schema> 
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FIG 3 
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FIG 4 
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